iOS

您所在的位置:网站首页 ios clang 编译 iOS

iOS

2024-07-16 22:40:04| 来源: 网络整理| 查看: 265

本文主要是理解LLVM的编译流程以及clang插件的开发

 

LLVM

LLVM是架构编译器的框架系统,以C++编写而成,用于优化任意程序语言编写的程序的编译时间(compile-time)、链接时间(link-time)、运行时间(run-time)以及空闲时间(idle-time)。对开发者保持开放,并兼容已有脚本

传统编译器设计

源码 Source Code + 前端 Frontend + 优化器 Optimizer + 后端 Backend(代码生成器 CodeGenerator)+ 机器码 Machine Code,如下图所示

图片

传统编译器设计

ios的编译器架构

OC、C、C++使用的编译器前端是Clang,Swift是swift,后端都是LLVM

模块说明

前端 Frontend:编译器前端的任务是解析源代码(编译阶段),它会进行 词法分析、语法分析、语义分析、检查源代码是否存在错误,然后构建抽象语法树(Abstract Syntax Tree AST),LLVM的前端还会生成中间代码(intermediate representation,简称IR),可以理解为llvm是编译器 + 优化器, 接收的是IR中间代码,输出的还是IR,给后端,经过后端翻译成目标指令集

优化器 Optimizer:优化器负责进行各种优化,改善代码的运行时间,例如消除冗余计算等

后端 Backend(代码生成器 Code Generator):将代码映射到目标指令集,生成机器代码,并且进行机器代码相关的代码优化

LLVM的设计

LLVM设计的最重要方面是,使用通用的代码表示形式(IR),它是用来在编译器中表示代码的形式,所有LLVM可以为任何编程语言独立编写前端,并且可以为任意硬件架构独立编写后端,如下所示

图片

通俗的一句话理解就是:LLVM的设计是前后端分离的,无论前端还是后端发生变化,都不会影响另一个

Clang简介

clang是LLVM项目中的一个子项目,它是基于LLVM架构图的轻量级编译器,诞生之初是为了替代GCC,提供更快的编译速度,它是负责C、C++、OC语言的编译器,属于整个LLVM架构中的 编译器前端,对于开发者来说,研究Clang可以给我们带来很多好处

LLVM编译流程

新建一个文件,写下如下代码

int test(int a,int b){ return a + b + 3; } int main(int argc, const char * argv[]) { int a = test(1, 2); printf("%d",a); return 0; }

通过命令可以打印源码的编译流程

//************命令************ clang -ccc-print-phases main.m //************编译流程************ //0 - 输入文件:找到源文件 +- 0: input, "main.m", objective-c //1 - 预处理阶段:这个过程处理包括宏的替换,头文件的导入 +- 1: preprocessor, {0}, objective-c-cpp-output //2 - 编译阶段:进行词法分析、语法分析、检测语法是否正确,最终生成IR +- 2: compiler, {1}, ir //3 - 后端:这里LLVM会通过一个一个的pass去优化,每个pass做一些事情,最终生成汇编代码 +- 3: backend, {2}, assembler //4 - 汇编代码生成目标文件 +- 4: assembler, {3}, object //5 - 链接:链接需要的动态库和静态库,生成可执行文件 +- 5: linker, {4}, image(镜像文件) //6 - 绑定:通过不同的架构,生成对应的可执行文件 6: bind-arch, "x86_64", {5}, image

LLVM编译流程

下面分别针对上述流程来解释,其中0主要是输入文件,即找到源文件。这里不做过多说明

一、预处理编译阶段

这个阶段主要是处理包括宏的替换,头文件的导入,可以执行如下命令,执行完毕可以看到头文件的导入和宏的替换

//在终端直接查看替换结果 clang -E main.m //生成对应的文件查看替换后的源码 clang -E main.m >> main2.m

需要注意的是:

typedef 在给数据类型取别名时,在预处理阶段不会被替换掉

define则在预处理阶段会被替换,所以经常被是用来进行代码混淆,目的是为了app安全,实现逻辑是:将app中核心类、核心方法等用系统相似的名称进行取别名了,然后在预处理阶段就被替换了,来达到代码混淆的目的

二、编译阶段

编译阶段主要是进行词法、语法等的分析和检查,然后生成中间代码IR

1、词法分析

预处理完成后就会进行词法分析,这里会把代码切成一个个token,比如大小括号、等于号还有字符串等,

可以通过下面的命令查看

clang -fmodules -fsyntax-only -Xclang -dump-tokens main.m

如果头文件找不到,指定sdk

clang -isysroot (自己SDK路径) -fmodules -fsyntax-only -Xclang -dump-tokens main.m clang -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator14.1.sdk/ -fmodules -fsyntax-only -Xclang -dump-tokens main.m

2、语法分析

词法分析完成后就是语法分析,它的任务是验证语法是否正确,在词法分析的基础上将单词序列组合成各类此法短语,如程序、语句、表达式 等等,然后将所有节点组成抽象语法树(Abstract Syntax Tree􏰊AST),语法分析程序判断程序在结构上是否正确

可以通过下面命令查看语法分析的结果

clang -fmodules -fsyntax-only -Xclang -ast-dump main.m

如果导入头文件找不到,可以指定SDK

clang -isysroot (自己SDK路径) -fmodules -fsyntax-only -Xclang -ast-dump main.m clang -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator14.1.sdk/ -fmodules -fsyntax-only -Xclang -ast-dump main.m

下面是语法分析的结果

图片

其中,主要说明几个关键字的含义

-FunctionDecl 函数

-ParmVarDecl 参数

-CallExpr 调用一个函数

-BinaryOperator 运算符

3、生成中间代码IR

完成以上步骤后,就开始生成中间代码IR了,代码生成器(Code Generation)会将语法树自顶向下遍历逐步翻译成LLVM IR,

可以通过下面命令可以生成.ll的文本文件,查看IR代码。OC代码在这一步会进行runtime桥接,:property合成、ARC处理等

clang -S -fobjc-arc -emit-llvm main.m //以下是IR基本语法 @ 全局标识 % 局部标识 alloca 开辟空间 align 内存对齐 i32 32bit,4个字节 store 写入内存 load 读取数据 call 调用函数 ret 返回

下面是生成的中间代码.ll文件

图片

其中,test函数的参数解释为

图片

编译阶段-4

当然,IR文件在OC中是可以进行优化的,一般设置是在target - Build Setting - Optimization Level(优化器等级)中设置。LLVM的优化级别分别是-O0 -O1 -O2 -O3 -Os(第一个是大写英文字母O),下面是带优化的生成中间代码IR的命令

clang -Os -S -fobjc-arc -emit-llvm main.m -o main.ll

这是优化后的中间代码

xcode7以后开启bitcode,苹果会做进一步优化,生成.bc的中间代码,我们通过优化后的IR代码生成.bc代码

clang -emit-llvm -c main.ll -o main.bc

三、后端

LLVM在后端主要是会通过一个个的Pass去优化,每个Pass做一些事情,最终生成汇编代码

生成汇编代码

我们通过最终的.bc或者.ll代码生成汇编代码

clang -S -fobjc-arc main.bc -o main.s clang -S -fobjc-arc main.ll -o main.s

生成汇编代码也可以进行优化

clang -Os -S -fobjc-arc main.m -o main.s

此时查看生成的main.s文件的格式为汇编代码

图片

生成汇编代码

四、生成目标文件

目标文件的生成,是汇编器以汇编代码作为插入,将汇编代码转换为机器代码,最后输出目标文件(object file)

clang -fmodules -c main.s -o main.o

可以通过nm命令,查看下main.o中的符号

$xcrun nm -nm main.o

以下是main.o中的符号,其文件格式为 目标文件

生成目标文件

_printf函数是一个是undefined 、external 的

undefined表示在当前文件暂时找不到符号_printf

external表示这个符号是外部可以访问的

五、链接

链接主要是链接需要的动态库和静态库,生成可执行文件,其中

静态库会和可执行文件合并

动态库是独立的

连接器把编译生成的.o文件和 .dyld .a文件链接,生成一个mach-o文件

clang main.o -o main

查看链接之后的符号

$xcrun nm -nm main

其中的undefined表示会在运行时进行动态绑定

通过命令查看 main是什么格式,此时是 mach-o可执行文件

六、绑定

绑定主要是通过不同的架构,生成对应的mach-o格式可执行文件

Clang插件开发 1、准备工作

由于国内网络限制,需要借助镜像下载llvm的源码,此处为镜像链接

下载LLVM项目

git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/llvm.git

在LLVM的projects目录下下载compiler-rt、libcxx、libcxxabi

cd ../projects git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/compiler-rt.git git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/libcxx.git git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/libcxxabi.git

在Clang的tools下安装extra工具

cd ../tools/clang/tools git clone https://mirrors.tuna.tsinghua.edu.cn/git/llvm/clang-tools-extra.git 2、LLVM编译

由于最新的LLVM只支持cmake来编译,所以需要安装cmake

安装cmake

查看brew是否安装cmake,如果已经安装,则跳过下面步骤

brew list

通过brew安装cmake

brew install cmake

编译LLVM

有两种编译方式:

通过xcode编译LLVM

通过ninja编译LLVM

通过xcode编译LLVM

cmake编译成Xcode项目

mkdir build_xcode cd build_xcode cmake -G Xcode ../llvm

使用xcode编译Clang

选择自动创建Schemes

图片

编译LLVM-1

编译(CMD + B),选择ALL_BUILD Secheme进行编译,预计1+小时

注:这里通过ALL_BUILD Secheme编译会报以下错误The i386 architecture is deprecated. You should update your ARCHS build setting to remove the i386 architecture,尝试着去解决,但是目前尚未找到好的解决方案(后续会补充)

替代方案:选择手动创建Schemes,然后编译编译Clang + ClangTooling即可

通过ninja编译LLVM

使用ninja进行编译则还需要安装ninja,使用以下命令安装ninja

brew install ninja

在LLVM源码根目录下新建一个build_ninja目录,最终会在build_ninja目录下生成``build.ninja`

在LLVM源码根目录下新建llvm_release目录,最终编译文件会在llvm_release文件夹路径下

cd llvm_build //注意DCMAKE_INSTALL_PREFIX后面不能有空格 cmake -G Ninja ../llvm -DCMAKE_INSTALL_PREFIX= 安装路径(本机为/ Users/xxx/xxx/LLVM/llvm_release)

一次执行编译,安装指令

ninja ninja install 3、创建插件

在/llvm/tools/clang/tools下新建插件CJLPlugin

在/llvm/tools/clang/tools目录下的CMakeLists.txt文件,新增add_clang_subdirectory(CJLPlugin),此处的CJLPlugin即为上一步创建的插件名称

在CJLPlugin目录下新建两个文件,分别是CJLPlugi.cpp 和CMakeLists.txt,并在CMakeLists.txt中加上以下代码

//1、通过终端在CJLPlugin目录下创建 touch CJLPlugin.cpp touch CMakeLists.txt //2、CMakeLists.txt中添加以下代码 add_llvm_library( CJLPlugin MODULE BUILDTREE_ONLY CJLPlugin.cpp )

图片

创建插件-3

接下来利用cmake重新生成Xcode项目,在build_xcode目录下执行以下命令

cmake -G Xcode ../llvm

最后可以在LLVM的xcode项目中可以看到Loadable modules目录下由自定义的CJLPlugin目录了,然后可以在里面编写插件代码了

图片

创建插件-4

编写插件代码

在CJLPlugin目录下的CJLPlugin.cpp文件中,加入以下代码

// create by CJL // 2020/11/15 #include #include "clang/AST/AST.h" #include "clang/AST/DeclObjC.h" #include "clang/AST/ASTConsumer.h" #include "clang/ASTMatchers/ASTMatchers.h" #include "clang/Frontend/CompilerInstance.h" #include "clang/ASTMatchers/ASTMatchFinder.h" #include "clang/Frontend/FrontendPluginRegistry.h" using namespace clang; using namespace std; using namespace llvm; using namespace clang::ast_matchers; //命名空间,和插件同名 namespace CJLPlugin { //第三步:扫描完毕的回调函数 //4、自定义回调类,继承自MatchCallback class CJLMatchCallback: public MatchFinder::MatchCallback { private: //CI传递路径:CJLASTAction类中的CreateASTConsumer方法参数 - CJLConsumer的构造函数 - CJLMatchCallback的私有属性,通过构造函数从CJLASTConsumer构造函数中获取 CompilerInstance &CI; //判断是否是用户源文件 bool isUserSourceCode(const string filename) { //文件名不为空 if (filename.empty()) return false; //非xcode中的源码都认为是用户的 if (filename.find("/Applications/Xcode.app/") == 0) return false; return true; } //判断是否应该用copy修饰 bool isShouldUseCopy(const string typeStr) { //判断类型是否是NSString | NSArray | NSDictionary if (typeStr.find("NSString") != string::npos || typeStr.find("NSArray") != string::npos || typeStr.find("NSDictionary") != string::npos/*...*/) { return true; } return false; } public: CJLMatchCallback(CompilerInstance &CI) :CI(CI) {} //重写run方法 void run(const MatchFinder::MatchResult &Result) { //通过result获取到相关节点 -- 根据节点标记获取(标记需要与CJLASTConsumer构造方法中一致) const ObjCPropertyDecl *propertyDecl = Result.Nodes.getNodeAs("objcPropertyDecl"); //判断节点有值,并且是用户文件 if (propertyDecl && isUserSourceCode(CI.getSourceManager().getFilename(propertyDecl->getSourceRange().getBegin()).str()) ) { //15、获取节点的描述信息 ObjCPropertyDecl::PropertyAttributeKind attrKind = propertyDecl->getPropertyAttributes(); //获取节点的类型,并转成字符串 string typeStr = propertyDecl->getType().getAsString(); // cout


【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭